وزارت علوم، تحقیقات و فناوری
دانشگاه علوم و فنون مازندران
پایان نامه
مقطع کارشناسی ارشد
رشته : فناوری اطلاعات
عنوان : رهیافتی برای نظرکاوی در متون خبری فارسی
استاد راهنما : آقای دکتر مینایی
تابستان 1391
برای رعایت حریم خصوصی نام نگارنده پایان نامه درج نمی شود
(در فایل دانلودی نام نویسنده موجود است)
تکه هایی از متن پایان نامه به عنوان نمونه :
(ممکن است هنگام انتقال از فایل اصلی به داخل سایت بعضی متون به هم بریزد یا بعضی نمادها و اشکال درج نشود ولی در فایل دانلودی همه چیز مرتب و کامل است)
چکیده :
در این پایاننامه به ردهبندی و تعیین گرایش یا قطبیت احساس در نظرات کاربران از نقطهنظر مثبت یا منفی بودن نظرات بیانشده، در یکی از پربازدیدترین سایتهای خبری ایران پرداختهایم. برای اینکار مشخصههای جدیدی را معرفی کردهایم. پس از جمعآوری و پیشپردازش متن نظرات و استخراج این مشخصهها، آنها را با استفاده از ردهبندهای مختلف در حالات و ترکیبهای گوناگون مورد بررسی قرار دادهایم. نتایج بدست آمده نشان از کارایی مناسب مشخصههای معرفی شده و ردهبندهای مورد استفاده دارند بهطوریکه بالاترین دقت (نود و سه درصد) در حالتی بدست آمده است که از تمام مشخصهها برای آموزش ردهبند استفاده شده است.
علاوه بر کار ردهبندی مذکور، با نگاهی به انواع دیگر چالشها، تحقیقات انجامشده، و مسائل متنوع مرتبط با کاوش در نظرات متنی کاربران (مانند تشخیص شخص بیان کنندهی نظر، تشخیص درجهی شدت گرایش، شناسایی نظرات نامطلوب، و…)، ایدهی جدید ایجاد یک موتور جستجوی نظرات مطرح و معماری پیشنهادی برای آن ارائه شده است.
کلمات کلیدی : کاوش در نظرات، تجزیهوتحلیل احساس، تعیین قطبیت احساس، ردهبندی احساس، شناسایی گرایش احساس، موتور جستجوی نظرات.
فهرست مطالب
فصل1 مقدمه…………………………………………………………………………………………. 1
1-1. مقدمه و ضرورت تحقیق …………………………………………………………………………………….2
1-2. اهداف تحقیق ………………………………………………………………………………………………..5
فصل2 پیشینهی تحقیق……………………………………………………………………………… 7
2-1. مقدمه……………………………………………………………………………………………. 8
2-2. چالشها و کارهای مرتبط با حوزهی کاوش در نظرات …………………………………………………..8
2-2-1. شناسایی شخص صاحب نظر…………………………………………………………………. 8
2-2-2. تشخیص هدف نظر اظهارشده………………………………………………………………… 9
2-2-3. درجهبندی نظر……………………………………………………………………………….. 9
2-2-4. جستجو و یافتن متون هدف…………………………………………………………………. 10
2-2-4-1. تشخیص موضوع………………………………………………………………………. 10
2-2-4-2. تشخیص زبان…………………………………………………………………………. 10
2-2-4-3. تشخیص وجود نظر…………………………………………………………………… 11
2-2-5. سطح مطالعهی گرایش احساس……………………………………………………………… 11
2-2-6. منابع لغوی………………………………………………………………………………….. 11
2-2-7. مشخصههای استفادهشده در مطالعات قبلی………………………………………………….. 12
2-2-8. خلاصهسازی………………………………………………………………………………… 12
2-2-9. وزندهی…………………………………………………………………………………….. 12
2-2-10. شناسایی نظرات نامطلوب………………………………………………………………….. 13
2-2-11. پیشپردازشهای لازم بر روی متن………………………………………………………… 13
2-3. ضعفهایی در مطالعات قبل که در راستای رفع آنها تلاش شده است ………………………………. 14
فصل3 معماری پیشنهادی برای یک موتور جستجوی نظرات…………………………………. 15
3-1. مقدمه………………………………………………………………………………………….. 16
3-2. واسط کاربر……………………………………………………………………………………. 16
3-3. مدیریتکنندهی جستجو………………………………………………………………………… 17
3-4. خلاصهساز نتایج……………………………………………………………………………….. 17
3-5. رتبهبند…………………………………………………………………………………………. 17
3-6. گسترشدهندهی پرسوجو……………………………………………………………………… 18
3-7. پایگاهدادهی اطلاعات تحلیلشده……………………………………………………………….. 18
3-8. خزشگر متمرکز……………………………………………………………………………….. 18
3-8-1. شناسایی وجود احساس………………………………………………………………….. 19
3-8-2. تشخیص موضوع…………………………………………………………………………. 19
3-8-3. تشخیص زبان……………………………………………………………………………. 19
3-9. پایگاهدادهی اسناد خام………………………………………………………………………….. 19
3-10. تجزیهوتحلیل دادهها………………………………………………………………………….. 19
3-10-1. تشخیص هدف عقیده…………………………………………………………………… 20
3-10-2. تشخیص شخص بیان کنندهی اظهارنظر…………………………………………………. 20
3-10-3. ردهبندی احساس……………………………………………………………………….. 20
3-10-4. تشخیص نظرات نامطلوب………………………………………………………………. 20
3-10-5. وزنگذاری نظر…………………………………………………………………………. 20
3-10-6. تجزیهوتحلیل شبکههای اجتماعی……………………………………………………….. 21
3-11. پیشپردازش اسناد و متون……………………………………………………………………. 21
3-11-1. استخراج جملات……………………………………………………………………….. 21
3-11-2. قطعهبندی……………………………………………………………………………….. 22
3-11-3. بررسی املا……………………………………………………………………………… 22
3-11-4. ریشهیابی……………………………………………………………………………….. 22
3-11-5. نرمالسازی……………………………………………………………………………… 22
3-11-6. تجزیه…………………………………………………………………………………… 23
3-11-7. برچسبگذاری اجزاء گفتار……………………………………………………………… 23
3-12. پایگاه دادهی اطلاعات پیشپردازششده………………………………………………………. 23
فصل4 روش تحقیق، آزمایشها، و نتایج……………………………………………………….. 25
4-1. مقدمه………………………………………………………………………………………….. 26
4-2. انتخاب زمینه…………………………………………………………………………………… 26
4-3. انتخاب و استخراج نظرات……………………………………………………………………… 27
4-4. مشخصههای مورد استفاده……………………………………………………………………… 28
4-5. پیشپردازشهای انجامشده و استخراج بردارهای مشخصه……………………………………… 30
4-6. انتخاب ردهبندها……………………………………………………………………………….. 31
4-7. آزمایشهای انجامشده………………………………………………………………………….. 32
4-8. تحلیل نتایج……………………………………………………………………………………. 41
4-8-1. بهترین نتایج……………………………………………………………………………… 41
4-8-2. بررسی ترکیب دو مشخصهی “گرایش آغازگر”، و “نشانههای سؤال”………………………. 41
4-8-3. بررسی افزودن مشخصهی “صفات و قیود استخراج شده به صورت خودکار” به دو مشخصهی قبل 42
4-8-4. بررسی تکتک مشخصهها……………………………………………………………….. 43
4-8-5. بررسی لحاظ و عدم لحاظ “نرمالسازی” و “تعداد رخداد” مشخصهها…………………….. 44
4-8-6. بررسی ردهبندهای مورد استفاده…………………………………………………………… 45
4-8-7. بررسی تاثیر حذف برخی از صفات و قیود وابسته به زمینه……………………………….. 46
4-8-8. بررسی برخی از ردهبندهای مهم و شناختهشدهی دیگر……………………………………. 46
فصل5 نتیجهگیری و کارهای آتی……………………………………………………………….. 48
5-1. نتیجهگیری……………………………………………………………………………………… 49
5-2. کارهای آتی……………………………………………………………………………………. 50
مراجع و ماخذ……………………………………………………………………………………….. 51
پیوست الف: 50 اظهارنظر استفاده شده (از 30 خبر)، بههمراه مشخصههای استخراجشده از داخل آنها. 55
واژهنامه فارسی- انگلیسی……………………………………………………………………………. 86
واژهنامه انگلیسی- فارسی……………………………………………………………………………. 88
چکیدهی انگلیسی………………………………………………………………………………………………….. 90
فهرست جداول
جدول4-1. نتایج بدستآمده با لحاظ تعداد رخداد و بدون نرمالسازی توسط ردهبند Naïve Bayesian 34
جدول4-2. نتایج بدستآمده با لحاظ تعداد رخداد و بدون نرمالسازی توسط ردهبند SVM…………. 35
جدول4-3. نتایج بدستآمده با لحاظ تعداد رخداد و بصورت نرمالشده توسط ردهبند Naïve Bayesian 36
جدول4-4. نتایج بدستآمده با لحاظ تعداد رخداد و بصورت نرمالشده توسط ردبند SVM…………. 37
جدول4-5. نتایج بدستآمده بدون لحاظ تعداد رخداد توسط ردهبند Naïve Bayesian………………. 38
جدول4-6. نتایج بدستآمده بدون لحاظ تعداد رخداد توسط ردهبند SVM………………………….. 39
جدول4-7. نتایج آزمایش مجدد 3 حالت منتخب پس از افزودن صفات و قیود وابسته به زمینه در کنار نتایج قبل 40
جدول4-8. نتایج استفاده از ردهبندهای دیگر در کنار نتایج قبل برای 4 حالت منتخب……………….. 40
فهرست اشکال
شکل3-1. معماری پیشنهادی برای یک “موتور جستجوی نظرات”……………………………………. 24
فصل1
مقدمه
1-1. مقدمه و ضرورت تحقیق
اطلاع از نظر دیگران از نقطهنظرات گوناگون دارای اهمیت فراوانی است. تصور کنید که قصد دارید کالا یا خدماتی را خریداری کنید. آگاهی از نظر مثبت یا منفی افرادی که قبلا آن کالا یا خدمات را خریداری کردهاند چقدر برای شما اهمیت دارد؟ آیا نظر آنها میتواند بر تصمیم شما تاثیرگذار باشد؟ اگر یک شرکت خدماتی داشتید به چه میزان علاقهمند به اطلاع از نظر مخاطبین خود در رابطه با مطلوبیت یا عدم مطلوبیت خدمات خود بودید؟ آیا اطلاع از نظر آنها در اتخاذ تصمیمات بهتر به شما کمک میکرد؟ اگر یک کاندیدای انتخاباتی بودید تمایل داشتید تا از اقبال یا عدم اقبال رایدهندگان نسبت به خود خبر داشته باشید؟
اگر به اطرافمان نگاه کن
برای دانلود متن کامل پایان نامه اینجا کلیک کنید
لینک بالا اشتباه است
:: بازدید از این مطلب : 609
|
امتیاز مطلب : 0
|
تعداد امتیازدهندگان : 0
|
مجموع امتیاز : 0